量子位 04-10 18:02

大模型能“原地”改参数了！字节Seed&北大新论文：测试时推理无需加层重训练

📌 一句话：字节跳动与北大联合发布突破性技术，让大模型在推理过程中直接修改自身参数，无需重训练或添加新层。

大语言模型传统上依赖预训练+微调的两阶段范式，参数在训练后固定，适配新任务成本高。

这不仅是技术优化，更是对"模型参数不可变"这一基本假设的挑战。想象一下，如果模型能像人一样边思考边调整认知方式，那AGI或许不再遥远。当然，安全性如何保障、实际部署效果如何，还需观察。但有一点可以确定：AI正在从"学完就用"向"边用边学"进化。

📖 原文链接